小米繼2月開源VLA大模型Xiaomi-Robotics-0後,近日公佈其真機後訓練全流程,旨在解決機器人從實驗室到實際生產的“最後一公里”問題。演示中,搭載該模型的機器人僅用20小時訓練便展現出精細操作能力,推動AI機器人成爲開箱即用的生產力工具。
小米開源47億參數機器人模型Xiaomi-Robotics-0,採用MoT混合架構,通過“大腦”與“小腦”協同工作,在消費級顯卡上實現實時推理,解決現有VLA模型因推理延遲導致動作遲緩的問題,提升機器人控制效率與泛化能力。
小米開源全新多模態大模型Xiaomi MiMo-VL-7B-2508,包含SFT和RL兩個版本。新版本優化了輸出模式,提升RL訓練穩定性,在MMMU、ChartQA等多項評測中取得突破性進步。模型創新性地支持"思考模式"和"非思考模式"切換,前者展示完整推理過程,後者響應更快。在小米內部VLM Arena評分達1131.2分,全面超越前代版本,在同類開源模型中保持領先優勢。
小米大模型團隊宣佈開源最新一代多模態大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 與 SFT 兩個版本。 官方數據顯示,新版模型在學科推理、文檔理解、圖形界面定位及視頻理解四項核心能力上全面刷新紀錄,其中 MMMU 基準首次突破70分大關,ChartQA 升至94.4,ScreenSpot-v2達92.5,VideoMME 提升至70.8。
Alibaba
$1
輸入tokens/百萬
$10
輸出tokens/百萬
256
上下文長度
$2
$20
-
$0.8
128
Baidu
32
Bytedance
$8
Deepseek
$4
$12
$1.6
Tencent
24
$0.5
$3
$9
16